بهینهسازی هستههای چندگانه در ماشینبردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریبآمیز
Authors
Abstract:
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخصگذاری آنها، قابلیت جستجوی سریع اطلاعات را به کاربران میدهند. یکی از چالشهای مهم در استفاده از این ابزار، صفحاتی هستند که از آنها بهعنوان صفحات فریبآمیز نام برده میشود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که میتوان به روشهایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روشهای یادگیری ماشین بر اساس ویژگیهای صفحات اشاره کرد. ازجمله الگوریتمهای یادگیری ماشین که در این حوزه استفاده شده است ولی نتایج قابلتوجهی را ارائه نکرده، الگوریتم ماشینبردارپشتیبان[i] (SVM) است. استفاده از هسته در ساختار طبقهبند SVM باعث میشود که دادههایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیشتر بتوانند با مدل خطی تفکیکپذیر شوند. این کار باعث افزایش دقت تفکیککنندگی مدل یادگیری ماشین میشود. اخیراً توسعهایی از SVM با نام SVM جفتی[ii] (TSVM) ارائه شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه[iii] برای تفکیک نمونههای هر کلاس استفاده میکند و توانسته نتایج بهتری در طبقهبندی ارائه کند. به دلیل استفاده از دو ابرصفحه در TSVM، لذا بهتر است تا از هستههای چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمیتوان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینهسازی ترکیبهای بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (GA) استفاده شده است که با بهرهگیری از آن در فرآیند تصمیمگیری هر اَبَرصفحه TSVM، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیادهسازی و ارزیابی روش پیشنهادی، از مجموعه دادگان UK-2006 و UK-2007 استفاده شده است که نتایج حاصل بیانگر مؤثر بودن ایده پیشنهادی در این پژوهش است.
similar resources
بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز
چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش ...
full textکاهش شکاف معنایی در دستهبندی پرسشها با بهرهگیری از قوانین طبقهبندی
چکیده: دستهبندی پرسشها[i] یکی از مؤلفههای حیاتی سیستمهای بازیابی اطلاعات[ii] و پاسخگویی به پرسش[iii] است. هدف از دستهبندی پرسش، شناسایی دقیق نوع پاسخ موردانتظار آن و انتساب برچسبی به آن مطابق با دستهای است که پرسش در آن قرار میگیرد. تاکنون با دو رویکرد مبتنی بر قانون[iv] و یادگیری ماشین[v]، پژوهشهای متعددی در این حوزه صورت پذیرفته است. هدف ما در این پژوهش تلفیق نتایج این دو رویکرد بهم...
full textکاهش شکاف معنایی در دسته بندی پرسش ها با بهره گیری از قوانین طبقه بندی
چکیده: دسته بندی پرسش ها[i] یکی از مؤلفه های حیاتی سیستم های بازیابی اطلاعات[ii] و پاسخ گویی به پرسش[iii] است. هدف از دسته بندی پرسش، شناسایی دقیق نوع پاسخ موردانتظار آن و انتساب برچسبی به آن مطابق با دسته ای است که پرسش در آن قرار می گیرد. تاکنون با دو رویکرد مبتنی بر قانون[iv] و یادگیری ماشین[v]، پژوهش های متعددی در این حوزه صورت پذیرفته است. هدف ما در این پژوهش تلفیق نتایج این دو رویکرد به م...
full textاستفاده از سیستم دستهبند چندگانه برای تشخیص بیماری آندومتریوز: رویکرد زیرفضای تصادفی
یکی از روشهای مناسب برای بهبود صحّت دستهبندی نمونهها، استفاده از چند دستهبند مختلف و سپس ترکیب نتایج خروجی آنها است که اغلب تحت عنوان «سیستمهای دستهبند چندگانه» یا «سیستمهای شورایی» خوانده میشوند. در این مقاله برای تشخیص بیماری آندومتریوز، سیستم دستهبند چندگانه براساس رویکرد زیرفضای تصادفی طراحی و پیادهسازی شده است. در این روش، دستهبندهای شورا با زیرمجموعههای ویژگی مختلف آموزش میبی...
full textایجاد روش هایی برای اندیس گذاری, جستجو و رتبه بندی صفحات برای موتور جستجوی معنایی در حوزه صفحات فارسی ict
با توجه به رشد روزافزون اطلاعات و دانش, حجم¬های بسیار بالا از این اطلاعات و دانش¬ها موجود می باشد که جستجو برای یافتن اطلاعاتی خاص در آن¬ها, به دلیل حجم¬های بالای آنها دیگر کار آسانی نمی¬باشد. همواره نیاز به سیستم¬هایی که بتواند اطلاعات مورد نیاز افراد را فراهم کند احساس ¬شده است. چالش¬های فنی در مسیر طراحی این گونه سیستم¬ها را می¬توان در دسته¬های کلی تقسیم¬بندی کرد. می¬توان به نحوه ذخیره سازی ...
کاربرد صفحات مستغرق در کاهش آبشستگی پایه استوانهای پلها
صفحات مستغرق سازههای مستطیلی نازکی هستند که به لحاظ داشتن زاویه با جهت جریان ناحیه پر فشار و کم فشار در دو طرف آنها ایجاد میشود. این سازهها باعث ایجاد گرداب ثانویه و تغییر الگوی جریان در کف رودخانه و در نتیجه تغییر روند انتقال رسوب و فرسایش میشوند. عملکرد صفحات مستغرق برای کاهش آبشستگی پایه پل و حرکت رسوب از اطراف صفحات به علت ایجاد جریان رو به پایین در جلوی آنها تحت تأثیر نحوه قرارگ...
full textMy Resources
Journal title
volume 46 issue 4
pages 135- 145
publication date 2016-10-03
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023